Lista taxonómica de referencia de reptiles de Costa Rica
BiodataCR: plataforma para la gestión del conocimiento y la información sobre la biodiversidad de Costa Rica
Introducción
La lista taxonómica de referencia de reptiles (clases Crocodylia, Squamata y Testudines)1 de Costa Rica de BiodataCR permite integrar datos de diferentes publicadores en el sistema e implementar controles de calidad en aspectos como ortografía de los nombres científicos, sinonimia, nombres de autores y clasificación taxonómica, entre otros.
La siguiente tabla muestra las 241 especies de la lista. La columna Estado indica si el nombre científico es aceptado o un sinónimo. Con los controles de la tabla, puede modificar la cantidad de especies desplegadas, ordenar los datos y realizar búsquedas.
La lista está disponible para descarga en formato de valores separados por comas (CSV) en:
lista taxonómica de referencia de reptiles de Costa Rica
El repositorio con los datos y el código fuente de los programas está en la dirección:
https://github.com/biodatacr/lista-taxonomica-referencia-reptiles
En las siguientes secciones, se describe el proceso de elaboración de la lista y se presentan algunas visualizaciones de los datos que contiene.
Elaboración de la lista
El proceso inició con una lista de especies proporcionada por un grupo de expertos en reptiles de Costa Rica, cuya estructura y formato se refinaron progresivamente para que los nombres científicos pudieran ser verificados en la lista taxonómica de referencia o Backbone Taxonomy de la Infraestructura Mundial de Información en Biodiversidad (GBIF), una organización dedicada a la integración de datos de biológicos de todo el mundo. El Backbone Taxonomy de GBIF se construye a partir del Catálogo de la Vida (COL), una lista integrada de nombres de especies de todos los grupos taxonómicos conocidos, y se completa con cerca de 100 fuentes adicionales de datos. Es actualizado periódicamente por medio de un proceso automático.
La verificación de los nombres científicos en el Backbone Taxonomy se llevó a cabo mediante un programa en el lenguaje R y su paquete rgbif. Este último proporciona acceso a los servicios web que componen la interfaz de programación de aplicaciones (API) de GBIF. Como resultado de esta verificación, se detectaron errores ortográficos, sinónimos, y se recuperaron elementos adicionales de datos, como autores y niveles taxonómicos superiores, entre otros.
Seguidamente, se describen en detalle las etapas del proceso de elaboración de la lista.
1. Lista inicial
La lista inicial contiene 248 especies de reptiles de Costa Rica y fue recopilada en el contexto del proyecto Biodiversidad en cifras (Bermúdez Rojas, Tania & Obando Acuña, Vilma, 2021). El documento fue proporcionado en formato XLSX (Microsoft Excel).
2. Lista intermedia
Se removieron de la lista inicial aquellas filas que no corresponden a datos (ej. título, autor, fecha, etc.) y el resultado se guardó en formato CSV, como una lista intermedia. De esta manera, se obtuvo un conjunto de datos debidamente estructurado, con una fila por cada especie y una columna por cada elemento de datos.
3. Lista final
La lista intermedia generada en el paso anterior se utilizó como entrada del programa generar-lista-taxonomica.R, el cual, en resumen, ejecutó las siguientes tareas:
“Limpió” la columna
especie(que contiene el nombre científico de la especie) al remover espacios en blanco innecesarios, caracteres especiales (i.e. no alfanuméricos) y palabras siguientes a la segunda (ej. autores), conservando así solamente las dos primeras palabras: género y epíteto específico (ej. Caiman crocodilus). El resultado se guardó en una nueva columna llamadaname.Buscó los nombres científicos de la columna
nameen el Backbone Taxonomy de GBIF y para cada recuperó elementos de datos como:- Nombre científico (género + epíteto específico + autores).
- Niveles taxonómicos (reino, clase, …, familia, género, especie).
- Estado (aceptado, sinónimo).
- Exactitud de la búsqueda (exacta, difusa).
- Nivel de confianza de la búsqueda (0…99).
La lista final consta de 241 nombres de especies de la lista original, revisados y corregidos, junto con los restantes elementos de datos recuperados del Backbone Taxonomy de GBIF. Además, se generó una lista de nombres de especies no encontrados con 7 nombres de especies para los que no se encontró coincidencia en el Backbone Taxonomy de GBIF.
Los elementos de datos (i.e. columnas) de la lista final están definidos de acuerdo con el Darwin Core (DwC), un estándar orientado a facilitar la publicación e integración de datos de biodiversidad, el cual incluye un glosario de términos comúnmente utilizados en listas de especies, registros de colecciones biológicas, observaciones de ciencia ciudadana y eventos de monitoreo, entre otras fuentes (Wieczorek et al., 2012).
La lista se empaqueta y distribuye en formato Darwin Core Archive (DwC-A), un archivo comprimido tipo ZIP que contiene archivos de datos en formato CSV y descriptores en formato XML. El DwC-A es el formato preferido para compartir datos en GBIF y en otras plataformas agrupadoras de datos de biodiversidad.
Visualización de los datos
En esta sección, se presentan algunas visualizaciones de las especies de la lista y de sus registros de presencia. Estos últimos fueron recuperados del portal de datos de GBIF.
Especies
Lista final e indicadores de la búsqueda de nombres
La siguiente tabla muestra las 241 especies de la lista final, junto con el nombre de cada especie en la lista inicial y las columnas correspondientes al nivel de exactitud (exacta, difusa) y nivel de confianza de la búsqueda (0…99).
Diferencias entre los nombres de la lista inicial y los de la lista final
La siguiente tabla muestra las especies en las que hay alguna diferencia entre el nombre proporcionado en la lista inicial y el resultante en la lista final, para los casos en que se encontró coincidencia en el Backbone Taxonomy de GBIF. Las diferencias se deben principalmente al uso de sinónimos y a errores ortográficos.
Nombres de especies no encontrados en el Backbone Taxonomy de GBIF
La siguiente tabla muestra la lista de nombres de especies no encontrados en el Backbone Taxonomy de GBIF. En todos estos casos, se encontró el nombre del género pero no la especie.
Cantidad de especies por clase y familia
El siguiente gráfico de barras muestra la cantidad de especies de la lista en cada clase y en cada familia.
Registros de presencia
Para contar con una aproximación de la cantidad de datos de presencia disponibles para cada una de las especies de la lista, se realizó una consulta al portal de datos de GBIF. Se encontraron 34763 registros de 208 de las 241 especies de la lista.
Cantidad de registros de presencia por especie
Especies en GBIF reportadas en Costa Rica y ausentes en la lista de referencia
Se realizó otra consulta al portal de datos de GBIF, de todos los registros de presencia de las clases Crocodylia, Squamata y Testudines (todas las especies, no solo las de la lista de referencia), la cual retornó 48322 registros de 311 especies.
Las siguientes son las especies que retornó la consulta y que no están en la lista de referencia.
Mapa de distribución
El siguiente mapa muestra la distribución geográfica de los registros de presencia de las especies de la lista de referencia (puede que algunas no tengan registros). Se incluyó una capa para cada una de las clases taxonómicas, las cuales pueden activarse y desactivarse con el control de capas. Al hacer clic sobre cada punto, pueden observarse algunos elementos de datos del registro de presencia correspondiente.
Referencias
Notas
Esta es la clasificación empleada en el Backbone Taxonomy de GBIF y en el Catálogo de la Vida.↩︎